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摘 要 : 针对 铁路 电 务 设备 故障 频 发 、 运 行 效率 低 且 无 有 效 故 障 预测 方法 等 现实 问题 ， 提 出 一 种 基于 开 - 均 值 一 邻 域 近 
似 条 件 粒 与 BP 神经 网 络 (KNE-BPNN) 的 电 务 设备 故障 预测 模型 。 首 先 ， 采 用 基于 区- 均值 聚 类 的 样 例 约 简 算法 约 简 
设备 故障 决策 表 中 的 宛 余 样 例 ; 其 次 ， 运 用 令 域 近似 条 件 炉 属性 约 简 方 法 对 样 例 约 简 后 故障 决策 表 中 的 非 作 要 属性 进 
行 约 简 ; 最 后 ， 使 用 经 过 样 例 和 属性 约 简 后 的 样本 集训 练 BP 神经 网 络 并 进行 模型 预测 ， 直 到 模型 输出 结果 满足 预 设 
条 件 为 止 。 实 验 结果 表明 KNE-BPNN 故障 预测 模型 的 预测 精度 和 泛 化 性 能 均 满 足 电 务 设备 管理 的 实际 需求 。 
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Fault prediction for communication andsignal equipment based on KNE-BPNN 
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Information science & Engineering, Southeast University, Nanjing 211189, China) 


Abstract: Based on the practical problems, such as frequent failures, low operating efficiency and lacking of effective fault 
prediction methods for railway communication and signal (C&S) equipment, a fault prediction model for C&S equipment 
based on K-means—neighborhood approximate conditional entropy and BP neural network (KNE-BPNN) is proposed. Firstly, a 
sample reduction algorithm based on K-means clustering is used to reduce the redundant samples in the equipment failure 
decision table. Secondly, using neighborhood approximate conditional entropy attribute reduction theory to reduce the 
non-essential attributes in the fault decision table after sample reduction. Finally, the BP neural network is trained by using the 
reduced sample set, and the model is trained until its output meets the expected requirement. The experimental results show 
that the prediction precision and generalization performance of the KNE-BPNN fault prediction model can meet the actual 
requirements. 
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0 引言 的 设备 故障 预测 方法 ， 预 测 设备 故障 的 发 生 ， 从 而 及 时 对 设备 
进行 维修 和 维护 ， 减 少 由 于 设备 故障 带 来 的 人 员 伤 害 和 经 济 损 

电 务 设备 作为 铁路 运输 系统 的 主要 设备 之 一 ， 在 铁路 运输 失 是 一 个 重要 且 现 实 的 问题 。 
安全 体系 中 发 挥 着 重要 的 保障 作用 * xs 。 近 年 来 ， 我 国 鉴于 故障 设备 预测 存在 较 高 的 研究 价值 ， 许 多 专家 学 者 对 
铁路 建设 逐步 完善 ， 铁 路 固定 资产 投资 逐年 增加 ， 铁 路 科技 也 ”这 类 问题 进行 了 深入 、 广 泛 的 研究 ， 也 产生 了 很 多 重要 的 研究 
在 不 断 创新 。 现 如 今 , 我 国 铁路 建设 已 经 步 入 高 速 发 展 的 道路 。 ”成 果 。 比 如 ， 利 用 支持 向 量 机 (SVM)、 神 经 网 络 、 灰 色 系 统 、 
与 此 同时 ,对 电 务 设备 的 稳定 性 和 可 靠 性 也 提出 了 更 高 的 要 求 。 ”模糊 系统 、 时 间 序 列 、 实 时 专家 系统 ， 等 进行 故障 设备 预测 方 
于 电 务 设备 内 部 结构 复杂 ， 极 易 发 生 故 障 。 为 了 减少 故障 的 。 面 的 研究 ”ee 。 其中， 人 工 神 经 网 络 具 有 自学 习 、 自 组 
发 生 ， 确 保 铁路 系统 安全 稳定 地 运行 ， 研 究 在 设备 运行 过 程 中 ” 织 和 非 线性 的 能 力 ， 并 且 能 够 克服 早期 人 工 智能 在 模式 识别 和 


小 


1 


收 稿 日 期 : 2018-03-23; 修 回 日 期 : 2018-05-12 ”基金 项 目 : 国家 自然 科学 基金 资助 项 目 〈61573127，61502144):; 河北 省 科技 厅 重 点 研发 计划 资助 项 
目 〈16455702D); 河北 师范 大 学 基金 资助 项 目 (L2017B09，S2016Y13) 

作者 简介 : 李 晨 光 〈1993-)， 男 ， 河 北 邯 部 人 ， 磊 士 研 究 生 ， 主 要 研究 方向 为 智能 信息 处 理 . 机 器 学 习 (1281518477@qq.com); 乔 帅 (1994-)， 女 ， 河 
北 邢 台 人 ， 硕 士 研究 生 ， 主 要 研究 方向 为 机 器 学 习 、 图 像 标 注 ; 杨 晓 杰 〈1990-)， 女 ， 河 北平 山 人 ， 硕 士 研 究 生 ， 主 要 研究 方向 为 机 器 学 习 、 图 像 识别 ; 解 伟 
凡 〈1997-)， 男 ， 河 北 石家庄 人 ， 本 科 生 ， 主 要 研究 方向 为 深度 学 习 ; 李 川 子 《1995-)， 女 ， 山 西 运城 人 ,硕士 研究 生 , 主要 研究 方向 为 深度 学 习 、 图 像 处 理 ; 
李 俊 红 《1971-)， 女 ， 山 西 运城 人 人， 副教授， 博士 ， 主 要 研究 方向 为 模糊 信息 处 理 、 深 度 学 习 . 


od 806.00124v1 


pai 


录用 稿 


非 结构 化 处 理 
引用 源 。 

在 实际 应 / 
数据 量 大 ， 关 系 复 杂 等 
入 和 


等 方面 的 不 足 ， 良好 


区 不 出 共 


不 利于 加 工 处 理 


中 ， 进 行 预测 的 样本 数据 往往 会 
的 情况 。 
经 网 路 预测 模型 容易 造成 模型 收敛 速度 


能 特 性 徊 器 ! 未 找到 


的 智能 


出 现 维度 高 ， 
这 样 的 数据 输 
曼 、 拟 合 程度 低 、 


泛 化 能 力 不 强 等 现象 ， 而 基于 粗糙 集 理 


论 的 属性 


慢 
约 简 能 够 从 复 


杂 的 数据 中 提取 出 潜在 的 、 精 度 高 的 、 分 类 
=。 虽然 粗糙 集 属 性 约 简 能 够 消除 宛 余 站 


性 能 好 的 数据 


提高 模型 训 


练 速度 ， 但 是 在 样本 集中 依然 存在 无 效 的 、 
串 己 


元 余 的 样 


测 模 型 呈现 过 学 习 、 过 拟 合 等 现象 ， 而 采 / 
的 样 例 约 


度 。 
现 阶段 铁路 


> 


简 算 法 能 够 有 效 地 约 简 元 余 样 例 ， 加 | 


有 务 部 门 对 于 电 务 设备 的 管理 3 


例 ， 使 预 
于 有 均值 聚 类 6569 
决 模型 的 学 习 速 


计 


要 依赖 人 工 方 


式 进行 ， 该 方式 存在 管理 
用 户 共享 等 浆 端 。 同时 ， 


I 


工作 繁琐 ， 管 理 效率 低 
铁路 电 务 设备 结构 复杂 ， 设 备 组 成 部 


， 不 适合 多 


提高 电 务 设备 的 安全 性 和 可 靠 性 ， 
决 的 重要 课题 。 
针对 上 述 


问题 ， 给 出 基于 样 例 和 属性 


采用 K- 均 值 聚 类 对 决策 表 进 行 样 
近似 条 件 烦 种 识 ! 未 找到 引用 源 对 约 
构建 基于 KNE-BPNN (KNE-BPNN 即 K- 均 


件 容 易 老 化 , 极 易 造 成 设备 故障 。 如 何 专 业 化 地 管理 
已 成 为 铁路 


的 设备 故障 数据 约 简 
方法 ， 并 在 此 基础 上 构建 模型 对 电 务 设备 故障 进行 预测 。 
例 约 简 ; 其 次 , 使 / 
简 后 的 决策 表 进行 属性 约 简 ; 


电 务 设备 ， 
] 忌 前 解 


务 部 


首先 
用 基于 邻 域 
最 后 
值 和 邻 域 近似 决策 


炉 的 BP 神经 网 络 ) 的 电 务 设备 故障 预测 模型 。 
该 模型 在 设备 故障 预测 方面 表现 出 6 


设备 智能 管理 提供 有 效 思路 和 方法 。 
1 ”KK- 均 值 样 例 约 简 


真实 的 样本 数据 集 往往 
模型 出 现 过 学 习 、 过 拟 合 等 
此 ， 采 | 
消除 样本 集中 的 无 关 、 元 余 样 例 ， 提 高 训 
力 。 
1.1 


存在 很 多 无 关 样 


K- 均 值 聚 类 算法 
K- 均 值 聚 类 是 一 种 传统 的 聚 类 算法 , 主要 


中 心 ， 并 根据 每 个 观测 样本 到 各 个 聚 类 中 


J4。 实 验 结果 表明 ， 


好 的 性 能 ， 可 为 后 续 电 务 


例 ， 这 类 数据 会 使 
情况 ， 导 致 模型 泛 化 能 力 降低 。 据 
j 基 于 K- 均 值 聚 类 的 样 例 约 简 算法 对 样本 集 进行 约 简 ， 
练 后 的 模型 的 泛 化 能 


样本 划分 成 天 个 类 别 , 使 得 每 个 观测 值 与 其 所 在 
间 的 距离 最 小 。 该 算法 首先 随机 选择 玉 个 观测 值 作为 初始 聚 类 
心 之 间 的 距离 将 样本 
划分 到 距离 最 小 的 复 。 然 后 计算 每 个 艇 的 均值 并 将 其 更 新 成 复 


目标 是 将 个 观测 
聚 类 的 均值 之 


李 展 光 ， 等 : 基于 


输出 : K 个 肾 类 ， 每 个 肾 类 的 平方 误差 最 小 。 


a) 令 和 迭代 次 数 了 = 工 ， 随机 选择 天 个 观测 样 


j 个 类 别 的 聚 类 中 心 C/ 四 ,7 =12… 天 。 


b) 计 算 每 个 观测 样本 与 所 


DIS(x, CiD),k =1,2,...,n, 
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KNE-BPNN 的 电 


设备 故障 预测 


AN 


本 分 别 作为 第 


了 聚 类 的 类 别 中 心 之 间 的 距离 


相 太 


DIS(x,c [i) =minfD1 (NX,c [iD),h=1,2,...,7), 则 将 Xi 划分 到 第 


] 个 聚 


Cc, 二 


值 V/。 


则 算法 终止 ， 


1.2 


的 聚 类 中 心 ， 迭 代 调 整 观测 值 的 类 别 划分 ， 直 到 各 个 徐 的 聚 类 
中 心 不 再 发 生 改 变 。 通 常 天 均值 聚 类 采用 平方 误差 准则 函数 ， 
该 准则 函数 可 以 使 KK 个 聚 类 尽 可 能 地 聚集 和 收 化 5.4。KK- 均 值 
聚 类 算法 流程 如 图 1 所 示 。 

开 - 均 值 聚 类 算法 的 执行 步骤 如 下 : 

输入 : 观测 样本 集 X 和 聚 类 数目 玉 ， 其 中 
=} 


样 个 


4 


中 0 
类 别 
决策 
别 作 
聚 类 
决策 


所 示 ， 


类 。 
c) 令 1=1+1， 更 


新 聚 类 中 


心 


的 值 


则 函数 J 的 


2 
2 


d) 如 果 | J [i+] 一 J 四 上 8 (8 为 极 小 值 ， 


否则 转 第 b) 步 。 


输入 数据 集 
X40 聚 类 数 


找到 距 商 
的 DIS(j,n)， 
将 x(j) 划 分 


簇 n 


令 ij=i+1 


中 心 


陋 机 选择 K 个 函数 ) 


样本 作为 聚 类 
中 心 


分 别 计算 每 个 
观测 值 x(j) 到 | 
K 个 聚 类 中 心 
的 距 商 

DISU.k) 


， 计 算 误差 平方 准 


一 般 为 107)， 


和 商 最 小 


到 


, 并 


更 新 K 个 聚 类 


计算 每 个 簇 的 
误差 平方 准则 


图 1 K- 均 值 聚 类 算法 流程 图 

样 例 约 简 算法 

样 例 约 简 是 基于 开 - 均 值 聚 类 算法 进行 约 简 的 。 首 先 根据 
集中 的 数据 关系 构建 设备 故障 二 维 决策 表 MDS (如 表 1 


Xx) 表示 样 例 ， prop 为 条 件 属 性 ， 


表示 代表 未 发 生 故 障 ，1 表示 发 生 故 障 )。 其 次 ， 指 


数 为 聚 类 数 


DD 代表 决策 属性 ， 其 


定 决 策 


KK ， 并 根据 决策 类 别 划分 数据 子 集 (不 包括 


为 个 聚 类 芯 
和 聚 类 中 心 ， 
类 别 样 例 所 


聚 类 中 心 。 然 后 采用 天 均值 村 
输出 天 个 聚 徐 。 最 后 计算 每 
5 的 比例 ， 


属性 ) MDS,,(k =1,2,.…, KK)， 计 算 每 个 数据 子 集 的 1 


约 简 比例 较 少 的 样 例 。 采 | 


久 值 ， 分 
案 类 算法 调整 
个 簇 中 的 不 同 
基于 
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开 - 均 值 聚 类 的 样 例 约 简 算 法 能 够 有 效 地 约 简 样本 


王 。 


中 的 无 关 、 


元 余 样 例 ， 减 少 元 余 样 例 对 模型 预测 的 影响 ， 提 升 模型 的 泛 化 


能 力 。 
表 1 决策 表 
prop, prop, prop; props D 
Xl 1 2 1 1 0 
Xx, 2 3 0 2 1 
723 3 3 1 1 1 
Xs 2 4 1 2 0 


基于 -均值 聚 类 的 样 例 约 简 算法 的 具体 实现 如 下 : a) 构 建 


维 决策 表 ， 将 决策 表 中 的 决策 类 别 数 设 为 聚 类 个 数 K;，b) 按 


照 决策 类 别 划分 数据 子 集 且 分 别 计算 各 数据 子 集 的 均值 ， 并 将 


均值 指定 为 各 个 簇 的 聚 类 中 心 Ci ， 


性 ; c) 按 照 氏 -均值 聚 类 算法 调整 各 个 


~ 


d) 根 据 各 个 复 中 不 同 决策 类 别 所 占 的 上 


本 。 样 例 约 简 的 算法 流程 如 图 2 所 示 。 


将 决策 类 别 数 
设 为 聚 类 的 个 
数 K 


计算 决策 类 别 
相同 样 例 的 均 
值 , 并 将 均值 
作为 聚 类 中 心 


其 中 数据 子 集 不 包括 决策 属 


聚 类 ， 最 终 得 到 天 个 簇 
例 ， 约 简 比 例 较 小 的 样 


获得 K 聚 艇 ， 
分 别 计算 每 个 计算 每 个 聚 艇 
观测 值 x(j) 到 中 不 同 决策 类 
别 所 占 比 例 


K 个 聚 类 中 心 
的 距 商 
DISUk) 
找到 距 商 最 小 


的 DIS(j,n) ， 
将 x(j) 划 分 到 
能 


吧 


法 流程 


错误 ! 文 档 中 没有 指定 样式 的 文字 。 


约 简 比例 小 
的 样 例 


其 


对 


于 天 均值 聚 类 的 样 例 约 简 储 
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2 ”基于 邻 域 近似 条 件 灼 粗 烟 集 属性 约 简 


2.1 粗粮 集 

粗糙 集 理 论 是 波兰 数学 家 Z.Pawlak 于 1982 年 提出 的 一 种 
处 理 非 确定 性 和 不 完整 性 知识 的 数学 工具 宝 于 9 。 采 用 规 
则 提取 方式 进行 属性 约 简 是 粗糙 集 理论 的 重要 研究 内 容 之 一 。 
现 有 的 属性 约 简 方法 主要 有 基于 保 正 域 的 决策 粗糙 集 属性 约 简 
方法 千林 找到 引用 源 。 基于 差别 矩 车 的 属性 约 简 简 方 光 错误 ! 未 找到 引 用 以 
及 信息 观 下 的 属性 约 简 方 法 ss ， 等 。 但 是 ， 经 典 粗糙 
集 理论 仅 适 用 于 处 理 离散 型 数据 ， 如 果 要 对 数值 型 数据 进行 约 
简 ， 需 要 事先 对 其 进行 数据 离散 化 操作 ， 而 离散 化 操作 可 能 会 
导致 重要 信息 的 损失 ， 影 响 后 续 约 简 操作 的 效果 “各 种。 
邻 域 粗糙 集约 简 模型 建立 在 邻 域 等 价 关系 基础 上 ， 不 需要 离散 
化 操作 就 能 有 效 处 理 数值 型 数据 ， 最 大 程度 地 保持 样本 集 的 分 
类 性 能 外 业 不 并 到 本 用 源 ， 。 
2.2 ” 邻 域 粗糙 集 
用 于 分 类 学 习 的 数据 集 可 以 定义 为 一 个 五 元 决策 系统 
NDS =(U,C,D,V,f): 其 中 U= {wi,w,…sW} 是 一 个 论 域 ,为 
非 空 有 限 集 ，C={c,C,…, 6,} 表 示 对 象 的 条 件 属性 ， 为 非 空 
限 集 , D={d,d;,…, d,} 表示 对 象 的 决策 属性 集合 , CD=9。 
V=UaV,， 其 中 A=CUD,V, 是 属性 a 的 值 域 。 
了 :Ux(CUD) 一 V 是 一 个 信息 函数 ， 它 为 每 个 对 象 的 每 一 个 
遇 性 均 设 置 一 个 信息 值 ， 即 Va es A,x eU, f(x,a)eV,。 

定义 103 对 于 任意 一 个 对 象 u; eU,BCC,u 在 属性 集 
B 上 的 邻 域 为 

Os(u)= {uu EU,Ag(ui,u;) < 6},06>0 (1) 

式 中 人 表示 两 个 对 象 之 间 的 距离 ， 通 常用 来 衡量 对 象 之 间 

的 相似 度 。 
若 4=CUD, 则 在 N 维 空间 A={al,a,,…,a,} 中 ， 样 本 

和 wj 之 间 的 Minkowsky 距离 为 


1 
Ay Go)=[> fa) -fu ,a) NF O) 


其 中 了 (ua, ) 表 示 在 属性 a, 上 的 取 值 。 


常见 的 Minkowsky 距离 函数 主要 有 三 种 ， 当 M =1 时 ， 此 
距离 函数 称 为 Manhattan 距离 ; 当 M =2 时 , 称 为 Euclidean 距 
离 ; 当 M =% 时, 称 为 Chebychev 距离 , 文中 主要 采用 Euclidean 
距离 。 

定义 2045] 在 领域 决策 系统 NDS = (U,C,D,V, 了 ) 中 
决策 属性 DD 决定 的 一 个 不 可 分 辨 关系 为 


IND(D)={(x,y) Cc UxU|VaeS,f(x,a) =f(y,a)} (3) 
那么 ,U /IND(D)={Y,Y，…, 癌 ,} 表示 决策 属性 DD 对 论 域 U 的 


划分 ，BcC 在 论 域 U 上 的 一 个 邻 域 关系 为 Ns ，6(w) 为 样本 
在 属性 B 上 的 邻 域 ， 则 决策 属性 集 D 相对 于 B 上 的 邻 域 上 


近似 为 
sD = Ui NeZ (4) 
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D 关于 B 的 邻 域 下 近似 为 
NsD= Ui NeY, (5) 
其 中 ，N 7 了 ={ulo)mnYz 办 usU} 
NaY ={u;|6s (ui)e Y,u, eU} 
定义 301 在 邻 域 决 策 系统 NDS = (U,C,D,V, 了 ) 中， 
VBcC,XCU， 久 在 和 Ns 关系 下 的 邻 域 近 似 精度 为 : 


INs X| 
ysl | (6) 


|X| 表 示 和 集合 的 势 (或 称 基 数 ，cardinal)， 


其 中 : Xz#9， 


0<Y,(X)<1., 
2.3 ”基于 邻 域 近似 条 件 灼 粗糙 集 理论 


定义 47 对 于 一 个 邻 域 决 策 系统 
NDS =(U,C,D,V,f)，vB ccC， 属性 集 B 的 邻 域 为 65(m)， 
决策 属性 DD 在 论 域 U 的 划分 为 TNDCLD) ={Y YYn}， 则 属 
性 B 相对 于 决策 属性 DD 的 邻 域 条 件 焙 为 

ms Ou) NY Os(u) NY 

NCH =-2 ,2 加 Jo [6 ] 0) 

定义 5 对 于 一 个 邻 域 决 策 系统 
NDS =(U,C,D,V,f)， 由 定义 1 可 知 VB SCC, 属性 集 B 的 
邻 域 为 0s(u)， 决 策 属性 DD 在 论 域 U 的 划分 为 
IND(D) ={Y YY,…, Ym} 。 由 定义 3 可 知 Ys(Y) 是 了 在 邻 域 条 
件 关 系 Ns 下 的 邻 域 近似 精度 ， 那么 决策 属性 D 相对 于 属性 B 


的 邻 域 近似 条 件 炉 为 
NACH(D|B)=->, {0 -ys(7)) x 


¥ . 8 
pL log, ca 


16s(u))| 
性 质 1 错误 ! 未 找到 引用 源 。 


给 定 一 个 邻 域 决策 系统 
NDS =(U,C,D,V,f)， 由 定义 1 可 知 VB Cc C ， 属 性 集 


邻 域 为 6;(u;)， 决 策 属性 吃 在 论 域 U 的 划分 为 
IND(D)={Y,Y,…,Y}， 那 么 邻 域 近似 条 件 烂 满足 
0< NACH(D|B)<nlog,n,(n=|U)): 
a) 当 且 仅 当 
VY, eU/ IND(D),|Y, EL, Vu eU,6s(u)=U 时 , 
NACH(D| B) = MAX{NACH} =nlogn 


b) 当 7 9- 党 | 


上 证 ， 
Blinn 
bit 
le >] 


=1， 即 所 有 对 象 都 是 正 域 中 的 元 素 时 ， 


NACH(D|B)= MIN{NACH} =0, 

性 质 2 下 二。 在 邻 域 决 策 表 系 统 
NDS =(U,C,D,V, 了) 中, 车 M,NCC 且 McN， 那 么 

NACH(D|M)> NACH(D|N)., 

性 质 3 和 fs 在 邻 域 决策 表 系统 
NDS =(U,C,D,V,f) 中 , 若 McC 且 aeM , 当 
NACH(D|M)> NACH(D|M-{a)) 时 ， 认 为 属性 a 相对 于 B 
来 说 是 不 必要 的 。 

定义 6 千 妆 ! 未 扫 到 引用 源 。 在 多 
NDS=(U,C,D,V,f) 中 ， 车 


了 域 决 策 表 系统 
McC ， 当 
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NACH(D|M)= NACH(D|O), 并 且 
vme M,NACH(D|M -{m)}) > NACH(D|O) 时, 称 M 是 C 
相对 于 万 的 一 个 约 简 。 

定义 7 各 环 1 未 规 到 引用 汪 。 给 定 邻 域 决策 系统 
NDS =(U,C,D,V,f)，vmeC,， Mm 相对 于 C 关 于 DD 的 内 部 
属性 重要 度 为 

IMP(m, C, D)= NACH(D | OO)—{m) —NACH(D| C) 09) 
定义 8 "aa 对 于 一 个 邻 域 决策 系统 
NDS =(U,C,D,V,f),， 当 YaeC， 如 果 
NACH(D|O)-{a})) > NACH(D|O), 即 IMP(a, C,D) >0, 
则 称 4 是 C 相对 于 万 的 一 个 核 属性 。 

定义 9 aas， 给 定 邻 域 决策 系统 
NDS =(U,C,D,V,f), 若 NCC, 当 YneC-N 时 , n 关 于 
万 的 外 部 属性 重要 度 为 : 

IMP(n, N, D)= NACH(D|N)—NACH(DIN Ut{n}) (10) 
2.4 ”基于 邻 域 近 似 条 件 炳 属性 约 简 算法 
通过 邻 域 粗糙 集 相 关 理论 获得 所 有 条 件 属性 集合 的 最 小 约 
简 是 一 个 NP 问题 ， 目 前 解决 此 类 问题 的 一 个 有 效 方式 是 采用 
自发 式 的 方法 进行 约 简 。 启 发 式 添加 策略 首先 获取 条 件 属性 的 
六 属性 ， 然 后 循环 比较 各 个 核 属性 的 属性 重要 性 ， 将 属性 重要 
性 IMP(a,C,D) 最 大 的 元 素 添 加 到 约 简 集 B 中 ， 即 
B=BU{a}, 直到 NACH(D|B)=NACH(D|C) 为 止 。 下 面 是 
基于 邻 域 近 似 条 件 灶 的 粗糙 集 属 性 约 简 算 法 的 基本 步 又 ， 


JI 


瓯 


输入 : 邻 域 决策 系统 NDS = (U,C,D,V, 了 ) 和 闽 值 5>0。 
输出 : 邻 域 决 策 系统 最 小 约 简 集 B 。 
a) 初 始 化 约 简 集 B， 令 B=9。 
b) Vu, eU ， 采 用 Euclidean 距离 计算 uw 在 条 件 属性 集 C 
下 的 邻 域 5.(4)。 
0o) 计 算 决 策 属性 D 关于 C 的 邻 域 近似 条 件 焙 
NACH(D|O). 


dva sc, 计算 IMP(a,C,D)，, 车 IMP(a,C,D)>0，, 则 
将 a 添加 到 约 简 集 B 中 ， 即 B=BUf{a;}。 

e) 如 果 Bzxp ， 计 算 NACH(D|IB) ， 若 
NACH(D|B)= NACH(D|C)， 则 执行 第 多 步 ， 否 则 转 到 第 6 
步 执行 。 若 妃 基 人 办， 则 直接 执行 第 信步 。 

f) va; eC-B， 计 算 a 的 外 部 属性 重要 度 IMP(a,,B,D)， 
若 a 满足 IMP(a,B,D)=max{IMP(a,, B,D),a, eC-B}】 (如 果 
有 多 个 属性 满足 该 条 件 ， 则 随机 选择 其 中 一 个 属性 )， 则 令 


B=BU{a.}， 并 跳 转 到 第 e) 步 。 
输出 属性 约 简 集 B ， 结 束 算法 。 
基于 邻 域 近似 条 件 灼 粗糙 集 属 性 约 简 算法 流程 如 图 3 


所 示 
3 ”基于 KNE-BPNN 的 故障 预测 模型 


基于 KNE-BPNN 故障 预测 模型 的 具体 步骤 如 下 : 
a) 利 用 设备 历史 故障 监测 数据 构造 初始 故障 决策 表 ; 


本 数据 
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b) 采 用 开 - 均 值 聚 类 方法 将 决策 表 中 的 样 例 聚 成 两 类 〈 样 
策 结果 仅 为 发 生 故 障 和 未 发 生 故 障 两 种 ), 计算 每 个 禾 
中 不 同 决策 类 别 样 例 的 比例 ， 约 简 比例 较 小 的 样 例 ; 
9 使 用 邻 域 近似 条 件 灶 约 简 算法 对 样 例 约 简 后 的 决策 表 


进行 属性 约 简 ， 去 除 决 策 表 的 元 余 属性 ; 
d) 经 过 b)c) 后 产生 一 个 新 的 约 简 决策 表 。 并 将 其 中 的 数据 
输入 BP 神经 网 络 ， 经 过 反复 训练 和 参数 调 优 ， 确 定神 经 网 路 


手 层 的 设置 以 及 每 层 神经 元 节点 的 个 数 ， 最 后 利用 调试 好 的 神 
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据 通过 添加 缺失 值 ， 蔡 换 一 些 异 常 值 ， 最 终 初始 化 成 
的 故障 决策 表 。 

b) 样 例 约 简 。 采 用 开 - 均 值 聚 类 方法 对 初始 故障 决策 表 按 
照 决 策 表 中 样 例 的 决策 类 别 数 N 将 样 例 聚 类 成 N 个 簇 , 然后 依 
次 计算 每 个 复 中 不 同 决策 类 别 的 样 例 集 所 占 的 比例 ， 并 将 比例 
较 小 的 样本 剔除 ， 从 而 完成 故障 决策 表 的 样 例 约 简 。 
9 属性 约 简 。 首 先 计算 故障 决策 表 中 所 有 条 件 属性 集 的 邻 
域 近似 条 件 焙 ， 初 始 化 属性 约 简 集 B 为 空 ， 并 将 所 有 内 部 重要 


经 网 络 对 设备 实施 故障 预测 。 


洒 
邻 域 决策 系统 
NDS=(U,C,DV,f ) 
和 靖 值 5 


计算 邻 域 近 似 条 
忻 炉 NACH(DIC) 


计算 1MP(@i,0,D ) 对 于 所 有 vbe C-B 


计算 1MP(b;,B,D) 


IMP(QyC,D)>0 
IMP(bi,B,D)=max 


a {IMP(b;, B,D)} 


度 大 于 0 的 
的 邻 域 近似 条 件 炉 ,判断 其 是 否 与 所 有 属性 的 近似 条 
若 相 等 ， 则 输出 ， 否则， 计算 除 属性 约 简 集 以 外 所 有 条 件 居 
的 外 部 重要 度 ， 并 将 外 部 重要 度 最 大 的 属性 添加 至 属 
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属性 添加 到 约 简 集中 。 然 后 迭代 计算 属 怕 


ml 


中 ， 并 再 次 进行 迭代 ， 直 到 属性 约 简 集 和 条 件 属性 身 
炉 相等 为 止 。 


dj) 神经 网 络 预测 模型 构建 (图 5 为 神经 网 络 的 


首先 根据 样本 的 维度 和 样本 的 类 别 数 分 别 确定 输入 层 节 点 数 和 


输出 层 节点 数 。 其 次 根据 样本 数据 量 和 维度 两 个 因素 确定 隐 含 


民 数 , 然后 为 隐 含 层 神经 元 设置 节点 数 范围 (例如 设置 隐 含 
的 神经 元 个 数 NW es(50] 且 N 为 正 整数 ), 从 该 范围 内 均匀 取 数 ， 


3 基于 邻 域 近似 条 件 焙 的 粗糙 集 属性 约 简 算法 流程 图 


图 

基于 KNE-BPNN 的 故障 预测 模型 采用 K- 均 值 样 例 约 简 和 
邻 域 近似 条 件 炉 属性 约 简 算法 对 故障 决策 表 进行 约 简 操 
作 ， 能 够 有 效 地 约 简 元 余数 据 ， 确 保 样本 数据 保留 更 好 的 分 类 
性 能 。 而 约 简 后 的 样本 集 输入 神经 网 络 后 ， 能 够 提升 神经 网 络 
的 训练 效率 ， 避 免 模型 出 现 过 学 习 、 过 拟 合 状况 。 图 4 为 基于 
KNE-BPNN 故障 预测 模型 工作 流程 ， 具 体 步骤 如 下 : 


了 故障 数据 决策 表 构 建 。 将 收集 到 的 电 务 设备 故障 监测 


个 二 维 


b 


. 对 决策 表 中 的 所 有 约 简 每 个 桶 类 中 
样 例 约 简 样 例 进行 K 均 信 角 类 占 比 小 的 样 例 


、 采用 信人 条 件 二 
对 决策 中 简 作 本 入 多 性 的 六 这 宙 全 
局 约 简 六 和 内 化 各 作 所 的 和 法 


3 pp 从 将 局 性 约 简 后 的 决策 表 
神经 网 络 确定 BP 神经 网 络 模型 二 输入 预测 型 


输出 模型 预测 结果 


图 4 基于 KNE-BPNN 的 故障 预测 模型 
输入 层 隐 合 导 输出 层 


hix hm 


图 5 神经 网 络 的 结构 图 


为 该 隐 含 层 的 神经 元 节点 数 。 通 过 反复 实验 确定 最 终 的 隐 
人 $ 层 神经 元 个 数 。 
6) 输出 结果 分 析 ,将 样本 测试 集 输入 训练 好 的 神经 网 络 模 
型 中 ， 最 终 得 到 样本 故障 情况 的 预测 结果 。 对 输 
fF ， 若 达 不 到 预测 目标 ， 则 继续 调整 模型 中 的 超 参 数 或 增加 训 
练 的 次 数 ， 直 到 输出 结果 符合 预 设 条 件 为 止 。 


构建 故障 数据 决策 表 
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C=(Ci CC) 


4 ”基于 KNE-BPNN 故障 预测 实例 分 析 
[二 tu x» Ee{xeU|x,=D,} 
k 


4.1 初始 化 决策 表 
文中 使 用 铁路 道岔 设备 电路 的 监测 数据 作为 KNE-BPNN 其 中 久 =0,1,.…, 尺 一 1,K >2，n 为 条 件 属性 个 数 ，M ,为 决策 
故障 预测 系统 的 样本 集 ， 如 表 2 所 示 。 将 表 2 中 的 数据 初始 化 。” 类 别 为 D, 的 样 例 集 的 个 数 , x 属于 由 决策 类 别 为 D, 的 样 例 组 


(12) 


成 一 个 决策 表 NDS = (U,C,D,V, 了) ,其 中 条 件 属性 C={ 温 度 ， ”成 的 样 例 集 。 

供电 电压 ， 发 送 电压 ， 发 送 频率 ， 接 收 1.1 电压 ， 接 收 1.2 电 表 3 标准 化 故障 决策 表 

压 , 干扰 电压 ， 故 障 情况 }， 决 策 属性 D={ 故 障 情况 } (发生 设 i 供电 发送” 发送” 接收 ”接收 ”干扰 ”故障 
备 故障 为 1， 设备 运转 正常 为 0)。 并 非 所 有 初始 决策 表 中 的 因 电压 ”电压 ”频率 1.1 电 压 1.2 电 压 电压 ”情况 


素 都 会 对 道 倪 设 备 故障 产生 影响 ， 而 通过 KK- 均值 样 例 约 简 以 


' 
OO 
le 
mn 


2.35 0.21 -0.52 -0.59 -0.54 -0.66 1 


及 邻 域 近似 条 件 粒 属 性 约 简 能 够 最 大 限度 地 保留 决策 系统 中 对 2 -028 237 0.16 -052 -0.53 -0.56 -0.65 1 
道岔 故障 具有 较 大 影响 的 样本 。 使 用 约 简 后 的 样本 进行 设备 故 3 -028 235 026 -0.54 -0.55 -0.56 -0.68 1 
障 预测 能 够 提高 模型 的 预测 精度 和 泛 化 能 4 -024 238 0.11 -051 -0.58 -0.52 -0.63 0 
表 2 铁路 道岔 设备 故障 决策 表 《〈 部 分 数据 ) 5 -023 237 0.13 -0.50 -0.57 -0.57 -0.63 1 
供电 发送 发送 接收 1.1 接 收 1.2 干扰 ”故障 6 -027 237 0.17 -0.52 -0.53 -0.58 -0.64 1 
编号 ”温度 
电压 ”电压 ”频率 电压 ”电压 ”电压 ”情况 7 -0.24 2.37 0.13 -0.51 -0.56 -0.55 -0.64 1 
1 28 201.5 58.67 9.85 5.07 85 063 1 8 -026 238 0.10 -0.50 -0.56 -0.52 -0.63 0 
2 25.5 205.23 55.72 9.75 8.92 6.95 076 1 9 -030 237 0.17 -0.52 -0.54 -0.53 -0.65 1 
3 25.8 192.92 59.94 9.66 876 816 072 1 10 -029 239 0.10 -0.50 -0.55 -0.51 -0.63 0 
4 299 225.37 56.14 9.69 5.01 8.91 059 0 11 -026 240 0.03 -050 -0.55 -0.52 -0.61 0 
5 297 221.47 56.45 9.58 489 46 047 1 12 -033 2.35 024 -0.51 -0.58 -0.52 -0.65 1 
6 272 212.87 58.16 9.56 8.54 5.07 0.68 1 13 -0.24 236 0.17 -0.53 -0.56 -0.56 -0.64 0 
7 294 2177 56.19 9.81 633 7.06 087 1 14 -031 238 0.12 -0.51 -0.51 -0.55 -0.63 0 
8 263 208.33 50.86 9.58 5.94 827 086 0 15 -035 238 0.14 -0.50 -0.52 -0.54 -0.61 0 
9 25 214.34 57.99 9.31 8.22 8.5 0.5 1 通过 分 析 故 障 决策 表 的 决策 属性 D， 可 以 明显 观察 到 决策 
属性 D 有 发 生 设 备 故障 和 设备 运转 正常 两 种 情况 , 分别 用 1 和 


10 24.1 207.77 50.42 9.45 5.96 8.62 0.78 0 
0 


11 28.6 238.51 51.7 9.79 6 8.34 0.74 0 来 表示 ， 因 此 聚 类 个 数 玉 = 2; 接着 对 样本 集 进行 标准 化 处 
12 20.5 190.59 56.48 9.11 4.88 842 0.48 1 理 〈 样 本 标准 化 处 理 结 果 如 表 3 所 示 ， 样 本 数据 均 保留 两 位 小 


13 29.5 2163 59.09 9.08 657 633 071 0 数 ), 数据 标准 化 既 能 保证 各 个 属性 之 间 的 差别 依然 存在 , 又 平 
14 23.7 216.8 54.19 9.16 8.76 645 066 0 衡 了 各 个 属性 之 间 的 量 级 。 然 后 按照 决策 类 别 划分 子 集 ， 计 算 
15 209 2277 57.83 9.55 7.53 61 06 0 各 个 子 集 的 均值 ， 将 其 作为 每 个 簇 的 聚 类 中 心 。 计 算 可 得 
4.2 KK- 均 值 样 例 约 简 C, =(-0.28, 2.38,0.11, -0.51,—0.55, -0.53, -0.63) 
在 采用 开 - 均 值 样 例 约 简 算法 约 简 样 例 之 前 ， 应 事先 确定 C | = (-0.27,2.36,0.18,-0.52,-0.56,-0.55,-0.65) 。 
好 聚 类 的 个 数 玉 以 及 每 个 簇 的 聚 类 中 心 C 。 由 开 - 均 值 样 例 约 确定 聚 类 中 心 后 ， 对 样 例 进行 聚 类 操作 ， 直 到 聚 类 中 心 不 
简 算法 可 知 ， 聚 类 个 数 开 应 设置 为 决策 表决 策 属性 的 类 别 数 。 再 发 生变 化 为 止 。 由 图 6 和 表 4 可 知 , 在 15 个 样 例 中 , 样 例 编 


而 为 了 使 大 多 数 样本 能 够 聚 类 到 样本 本 身 所 属 的 类 别 ， 先 对 样 ”号 为 5，7 和 13 的 样本 被 错误 划分 ， 因 此 为 了 避免 模型 出 现 过 
本 集 进 行 标准 化 处 理 ， 也 就 是 对 每 个 样本 按照 去 均值 和 方差 进 ” 学 习 ， 过 拟 合 现象 ， 应 将 这 3 个 样 例 去 除 。 
行 缩 放 操作 ， 即 


^ XxX—X_mean 
X 二 一 一 一 一 
xXx_std 
(11) 
其 中 :X_mean 为 均值 ，X_ std 为 标准 差 。 
其 次 ， 将 样 例 集 按照 决策 类 别 划 分 子 集 ， 然 后 计算 每 个 子 
的 均值 ， 并 将 这 些 均值 作为 各 个 艇 的 聚 类 中 心 Ct 。 即 


本 
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图 6 聚 类 结果 示意 图 
样 例 的 聚 类 结果 如 表 4 所 示 。 
表 4 样 例 聚 类 分 析 结 果 
编号 ”实际 类 别 ” 聚 类 类 别 ”编号 实际 类 别 聚 类 类 别 
1 1 11 0 0 
2 1 1 12 1 1 
3 1 1 13 0 1 
4 0 0 14 0 0 
5 1 0 15 0 0 
6 1 1 
7 1 0 
8 0 0 
9 1 | 
10 0 0 


4.3” 邻 域 近似 条 件 粹 属性 约 简 


样 例 约 简 
率 低 的 | 


青 况 发 生 ， 采 用 邻 域 近似 条 件 


哥 作 完成 之 后 ， 为 防止 模型 训练 速度 过 
焙 属 性 约 简 算 法 对 条 件 属 


性 进行 约 简 。 


表 3 可 知 在 设备 故障 决策 表 有 7 个 条 件 属 


性 ， 


在 进行 属性 约 简 操作 时 ， 


个 数 。 


通过 


四 整 阅 值 5 能 够 控制 约 简 属性 


一 般 情 况 下 ， 约 简 后 的 届 


怕 


的 一 半 ， 而 且 属 
M. e[4,5], 且 怕 ,为 整数 。 


[0.38,0.41) ， 
[0.50,0.52] 。 
个 闹 值 ， 即 6 =0.39 ， 
6, =0.51, 


最 后 ， 将 各 个 阔 
网 络 ， 并 比较 各 个 病 值 所 对 
性 约 简 子 集 作为 最 终 的 约 简 


E 子 集 个 数 应 大 于 
性 子 集 应 尽 可 能 的 小 。 


所 以 


笃 计算 满足 要 求 的 0 
将 [0.38,0.52] 以 0.03 为 间隔 分 成 5 


[0.41,0.44) ， 
然后 ， 从 每 个 
6, =0.43， 
值 约 简 后 的 样 侈 


[0.44,0.47) ， 
区 间 内 取 一 个 随机 数 ， 最 终 得 到 5 
06; =0.44， 


人 


es 


原 始 帅 


jt 


份 3 


[0.47,0.50) ， 


=0.49 ， 


的 
性 集 
届 性 集 的 个 数 
e[0.38,0.52]， 
分 别 为 


慢 ， 学 习 


屋 


本 


集 ， 依 次 输入 神经 


次 为 温度 ， 供 电 
接收 1.2 电压 ， 
致 ，04 和 a5 的 约 简 结果 也 一 致 ， 
约 简 集 进行 比较 。 
申 经 网 络 中 进行 训练 ， 每 个 约 简 
预测 


7 


讽 
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{a,,a4,as,a6,27} 


{a,,a4,a5,a6,27} 


三 种 阔 值 比较 


7 三 种 阔 值 比较 情况 
代表 道岔 故障 决策 表 中 的 7 个 条 件 属性 ， 依 
EE 压 ， 发 送 电 压 ， 发 送 频 率 ， 接 收 1.1 电压 ， 
扰 电 压 。 如 表 5 所 示 ，0 和 2 的 约 简 结果 一 
丸 此 应 选择 人 ,0O;,O4 所 对 应 的 
三 种 约 简 结果 输入 到 参数 设置 相同 的 
结果 进行 10 次 预测 ， 取 10 次 
结果 平均 值 ， 选 出 其 中 预测 结果 较 好 的 属性 约 简 集 。 如 图 
所 示 ， 在 经 过 多 次 神经 网 络 预测 后 ， 阔 值 6 = 0.44 对 应 的 预 
精度 最 高 ， 所 以 应 选择 条 件 属性 为 {ai,az,as,a4} ( 即 温 


预测 精度 


令 al 一 37 分 别 


分 别 将 


EC 


供 


电压 、 发 送 电 压 、 发 送 频率 ) 的 约 简 样本 集 输入 神经 网 络 。 


4. 


面 分 别 就 
属性 约 简 


其 中 差别 矩阵 属 
数据 离散 化 操 


4 两 种 属性 约 简 算 法 对 比 

为 进一步 验证 邻 域 近 似 条 件 粹 属性 约 简 算法 的 有 效 性 ， 

差别 矩阵 属性 约 简 算法 全 Fe 和 邻 域 近似 条 件 灶 

算法 从 属性 约 简 数目 和 预测 精度 两 个 角度 进行 对 比 。 

性 约 简 是 在 equal frequency binning( 等 频 分 箱 ) 

作 的 基础 上 完成 的 , 具体 实验 结果 如 表 6~8 所 示 : 
表 6 两 种 算法 约 简 个 数 比较 


约 简 后 条 件 属 
文献 [10] 算 法 


性 个 数 
本 文 算法 


数据 集 


故障 决策 表 3 4 


表 7 两 种 算法 约 简 得 到 的 条 件 属性 


约 简 后 得 到 的 条 件 属性 
文献 [10] 算 法 本 文 算法 


数据 集 


故障 决策 表 


{a,q,, 4} 


{a, a,,as,a,} 


应 的 预测 精度 ， 选 择 精度 最 高 的 属 
结果 。 


表 5 不 同 闵 值 的 属性 约 简 结果 
阔 值 属性 约 简 集 
0.39 {ai,a,,a3,27} 
0.43 {a1,2,,a3,27} 
0.44 {a1,2,,a3,a4} 


本 


效 的 约 
差别 矩阵 属 


表 8 BP 神经 网 络 模型 下 两 种 约 简 算法 预测 准确 率 对 比 
约 简 后 条 件 属性 个 数 
文献 [10] 算 法 本 文 算法 
74% 92% 


数据 外 


Nt 


故障 决策 表 
通过 上 述 实验 结果 可 知 邻 域 近 似 条 件 灶 属 性 约 简 算法 能 有 
简 样 本 集中 的 元 余 属 性 ， 同 时 模型 的 预测 精度 也 远 高 于 
性 约 简 算 法 。 因 此 邻 域 近似 条 件 业 属 性 约 简 算法 是 
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一 种 更 加 有 效 的 约 简 方法 。 14 0.8841 1 39 0.000091 0 
4.5 BP 神经 网 络 预测 模型 15 0.99957 1 40 0.999569 1 
随 着 深度 学 习 研 究 的 不 断 深入 ， 很 多 学 者 针对 特定 问题 设 16 1 1 41 0.99856 0 
计 出 针对 性 的 深度 神经 网 络 , 主要 包括 CNN( 卷 积 神经 网 络 )、 1 1 1 42 0.87962 1 
RNN 循环 神经 网 络 )、LSTM (长 短期 记忆 网 络 ) 以 及 近期 大 18 1 1 43 0.60502 1 
究 热 点 一 一 GANs (生成 对 抗 网 络 ) 等 。 其 中 CNN 适用 于 处 理 19 0.99956 1 44 0.99874 0 
图 像 数据 ，RNN 常用 于 解决 语言 识别 和 机 器 翻译 问题 ，LSTM 20 1 1 45 0.00642 0 
适合 处 理 和 预测 时 间 序 列 中 间隔 和 延迟 相对 较 长 的 事件 ， 而 21 1 1 46 0.88566 1 
GANS 可 进行 图 文 转 换 以 及 图 片 降 噪 等 操作 。 由 于 目前 铁路 电 22 1 1 47 0.64724 1 
务 设备 监测 指标 (属性 ) 较 少 ， 通 过 系统 监测 获取 到 的 数据 规 23 1 1 48 1 1 
模 相对 较 小 并 且 数 据 复 杂 度 也 相对 较 低 ， 因 此 应 用 上 述 四 种 网 24 0.580633 1 49 0.90369 1 
络 进行 实施 故障 预测 并 不 能 提升 预测 模型 的 预测 精度 ， 而 且 还 25 0.999566 1 50 1 1 
有 可 能 在 模型 学 习 阶 段 耗 费 大 量 的 时 间 。 而 BP 神经 网 络 因 其 5 结束语 
自身 结构 特征 ， 极 其 适合 处 理 较 小 规模 的 预测 问题 ， 故 本 文选 A 
用 BP 神经 网 络 搭建 故障 预测 模型 。 文中 针对 铁路 电 务 设备 故障 频 发 、 运 行 效率 低 且 无 有 效 故 
考虑 到 实际 应 用 中 电 务 设备 对 应 的 样本 数据 属性 较 少 ,， 样 。” 障 预测 方法 等 现实 问题 , 提出 一 种 基于 K- 均 值 聚 类 、 邻 域 近似 
本 理想 分 类 函数 复杂 性 较 低 ， 故 在 设计 电 务 设备 故障 预测 模型 。 条 件 业 、 以 及 BP 神经 网 络 的 电 务 设备 故障 预测 模型 ， 能 够 为 
时 优先 选择 3 层 BP 神经 网 络 模型 。 在 经 过 均值 样 例 约 简 和 ” ” 后 续 电 务 设备 智能 管理 提供 有 效 思路 和 方法 。 
邻 域 近似 条 件 炳 属性 约 简 后 ， 样 例 的 条 件 属 性 集 有 4 个 属性 ， 前 在 设备 故障 预测 阶段 主要 使 用 设备 日 常 监测 数据 进行 
因此 神经 网 络 的 输入 层 神经 元 节点 数 为 4。 由 于 故障 预测 问题 。 故障 的 预测 。 但 铁路 运输 调度 的 不 同 ， 不 同 设备 发 生 故 障 后 对 
是 一 个 二 分 类 问题 ， 所 以 输出 层 神经 元 节点 数 为 1。 经 过 不 断 ” 铁路 运输 造成 的 损失 不 同 。 所 以 下 一 步 的 研究 应 额外 设置 设备 
的 训练 和 对 比 , 最 终 确定 隐 含 层 神 经 元 节点 数 为 30 时 , 神经 网 ”故障 损失 决策 表 ， 将 设备 故障 引起 的 损失 和 设备 故障 发 生 概率 
路 的 收敛 速度 和 预测 精度 达到 了 预期 效果 。 此 外 ， 将 神经 网 络 。 和 集成， 最 终 形成 设备 维修 紧急 程度 列表 ， 电 务 维修 人 员 可 按照 


隐 含 层 激活 函数 设置 成 ReLu 来 加 怕 
i Sigmoid 函数 为 输 则 


通过 设 


| 
| 


故障 预测 模型 的 训练 速度 ， 
层 的 激活 函数 ， 确 保 模 型 输出 结 


紧急 程度 列表 去 检修 设备 ， 最 大 程度 地 降低 由 于 设备 故障 所 造 


成 的 人 员 和 财产 损失 。 


果 保 持 在 [0,]] 之 间 。 同时 ， 随 着 铁路 智能 技术 的 不 断 革 新 ， 未 来 的 铁路 智能 系 
当 故 障 预 测 模型 训练 结束 后 ,选取 50 组 测试 样本 输入 改 障 。“” 统 可 以 对 电 务 设备 实施 更 全 方位 的 监测 , 能够 获取 到 维度 更 多 、 
预测 模型 ,评估 故障 预测 模型 的 性 能 , 最 终 得 到 50 组 测试 集 的 。 ”复杂 度 更 高 的 数据 。 同 时 ， 随 着 系统 的 普及 应 用 ， 获 取 的 数据 
故障 预测 结果 (如 表 6 所 示 )。 由 表 6 数据 可 知 ， 在 50 组 测试 。 量 也 越 来 越 大 。 本 文 所 提 的 BP 神经 网 络 技术 对 多 维 复杂 大 量 
样本 中 有 4 个 测试 样本 出 现 了 错 分 情况 ， 分 别 是 编号 为 2、10、 ”数据 的 处 理 效 率 会 不 尽 如意 ， 需 要 借助 于 深度 神经 网 络 学 习 更 
41 和 44 的 样本 。 多 的 复杂 数据 所 蕴含 的 特征 ， 从 而 实现 电 务 设备 故障 的 高 精准 
表 9 测试 样本 集 的 预测 结果 预测 。 
编号 ”预测 结果 真实 类 别 ”编号 ”预测 结果 ”真实 类 别 
1 0.000002 0 26 0.999999 1 参考 文献 : 
2 0.998718 0 27 0.006536 0 [1] 兢 原 斌 . 浅 谈 铁路 电 务 系统 故障 应 急 处 置 存在 问题 及 对 策 [加 . 铁道 通 
3 0.000186 0 28 0.999983 1 信 信 号 ,2012, 48 (01): 46-47. (Gong Yuanbin. Discussion about the 
4 0.628283 1 29 0.887141 1 problem and strategy according to emergency fault handling of railway 
5 0 0 30 0.000178 0 electrical System [J]. Railway Signaling & Communication, 2012, 48 (01): 
6 1 1 31 0.000034 0 46-47. ) 
7 0.893361 1 32 0.999993 1 [2] 艾 红 , 周 东 华 . 动态 系统 的 故障 预测 方法 [有 ]. 华中 科技 大 学 学 报 : 自 
8 0.999974 1 33 0 0 然 科学 版 ，2009, 37 (S1): 222-225. (Ai hong, Zhou Donghua. Fault 
9 0.000072 0 34 1 1 prediction approach for dynamic system [J]. Journal of Huazhong 
10 0.998752 0 39 0.00021 0 University of Science and Technology: Natural Science Edition, 2009, 37 
11 0 0 36 0.000244 0 (S1): 222-225. ) 
12 0.00018 0 37 0.999561 1 [3] 朱 大 奇 , 人 工 神经 网 络 原理 及 应 用 [M]. 北京 : 科学 出 版 社 , 2006. (Zhu 
13 1 1 38 0.999565 1 Daqi. Principle and application of artificial neural network [MI]. Beijing: 
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